Trabalho Prático da Disciplina BCC 266 - TP 2

Neste trabalho, o aluno entrará em contato com sistemas de memória, particularmente com o sistema cache.

O aluno irá adicionar um sistema de cache em 3 níveis ao TP1, assim como ilustra a figura a seguir.

## Simulando o sistema de memória



Memória principal > C3 > C2 > C1

Assim como no TP1, as memórias possuem conteúdos denominados palavras e estas podem ser do tipo inteiro, booleano, byte ou qualquer outro suportado pela linguagem escolhida para fazer o TP. A memória principal é particionada em blocos e a memória cache é particionada em linhas, conforme ilustra a figura a seguir:

Todas as memórias como vetores de inteiros

0 1 2 3 4 5 ....

100 243 12 66 32 234 .....

Identifica uma palavra

Memória principal dividida em blocos lógicos

Bloco 0 Memórias cache divididas em linhas

Bloco 1 L1 L2 .....
Ln L1 L2 .....

Bloco n TANTO LINHAS QUANTO BLOCOS SÃO

Simule o mapeamento associativo ou o mapeamento associativo em conjunto para a troca de linhas (e consequentemente palavras) entre as caches e a memória principal. Não pode ser o mapeamento direto disponibilizado pelo professor no site da disciplina. Este serve apenas como base para a construção dos demais.

COMPOSTOS POR PALAVRAS

Para substituição de linhas de cache, use alguma das políticas explicadas pelo professor, sejam elas LRU ou LFU.

Por fim, utilize o gerador de instruções, disponível no site da disciplina para as linguagens Java, C++ e Python. Tais geradores simulam as repetições de instruções necessárias para o efetivo resultado das memórias cache.

Resultados: Na forma de tabelas (veja a figura a seguir), ilustrando cache hit e cache miss, assim como tempo hipotético de execução do programa. Faça isto para TODOS os tipos de máquinas testadas. Altere os tamanhos de cache, o número de caches, o nível de repetição de instruções e as políticas de substituição.

## RESULTADOS de forma TABULAR

50% de repetição, 75% de repetição, 90% de repetição

|    | Cache 1 | Cache 2 | Cache 3 | Taxa C1<br>% | Taxa C2<br>% | Taxa C3<br>% | Taxa de<br>RAM % | Taxa de<br>disco % | Tempo de<br>Execução<br>(unidade<br>hipotética) |
|----|---------|---------|---------|--------------|--------------|--------------|------------------|--------------------|-------------------------------------------------|
| M1 | 8       | 16      | 32      |              |              |              |                  |                    |                                                 |
| M2 | 32      | 64      | 128     |              |              |              |                  |                    |                                                 |
| МЗ | 16      | 64      | 256     |              |              |              |                  |                    |                                                 |
| M4 | 8       | 32      | 128     |              |              |              |                  |                    |                                                 |
| M5 | 16      | 32      | 64      |              |              |              |                  |                    |                                                 |

Por fim, veja como vai ser a ideia de estender o TP1 para construir o TP2. Inicialmente, o aluno vai ter que criar as memórias cache níveis 1, 2 e 3, similar à memória RAM. Uma diferença substancial é que as memórias não serão mais vetores de inteiros simples, mas sim vetores de blocos no caso da RAM e vetores de linhas no caso das memórias cache. Cada bloco ou cada linha é um vetor de inteiros com 4 palavras.

Veja como ficaram as memórias de uma forma bem simplificada. Neste caso, as memórias caches são feitas também por blocos, algo que não corresponde à realidade, mas que iremos aceitar no TP2 por questões de simplificação:

```
Instrucao[] memoriaInstrucoes;
BlocoMemoria[] RAM = new BlocoMemoria[tamanhoRam];
BlocoMemoria[] cache1 = new BlocoMemoria[tamanhoCache1];
BlocoMemoria[] cache2 = new BlocoMemoria[tamanhoCache2];

Veja como é fácil a estrutura de um bloco:
public class BlocoMemoria {

    //BlocoMemoria.palavras[0] => um dado da ram

    int[] palavras;
    int endBloco;
    boolean atualizado;
    int custo;
    int cacheHit;
```

Na máquina interpretada, o aluno terá que mudar o acesso à RAM, pois agora há também o acesso às memórias caches. Iremos encapsular todo o acesso ao sistema de memória numa função chamada UCM (Unidade de Controle de Memória). Veja a seguir onde foram feitas as intervenções na máquina interpretada do TP1 para adicionarmos as chamadas à função do TP2 denominada UCM. Ilustramos com a soma, mas o mesmo ocorre com qualquer acesso à memória RAM do TP1.

```
void maquinaInterpretada(int[] umaInstrucao){
    int opcode = umaInstrucao[0];
    switch (opcode){
        //SOMAR
        case 0:{
            int end1 = umaInstrucao[1];
            int end2 = umaInstrucao[2];
            //buscar na RAM
            int conteudoRam1 = RAN[end1]; UCM.obtem(RAM,cache1,cache2,cache3,end1);
            int conteudoRam2 = RAM end2]; UCM.obtem(RAM,cache1,cache2,cache3,end2);
            int soma = conteudoRam1+conteudoRam2;
            //salvando resultado na RAM
            int end3 = umaInstrucao[3];
           —RAM[end3] = soma; UCM.salva(RAM,cache1,cache2,cache3,end3,soma);
            System.out.println("somando " + conteudoRam1 + " com " + conteudoRam2 +
            break;
        }
```